电子 资源 管理 过 程 中 数据 质量 控制 研究 
一 一 以 清华 大 学 图 书馆 基于 ALMA 系统 的 实践 为 例 ' 
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摘要 : [目的 /意义 ] 介 绍 清华 大 学 图 书馆 借助 ALMA 系统 对 电子 资源 管理 和 质量 控制 的 经 验 ， 可 
为 同行 图 书馆 在 下 一 代 图 书馆 服务 平台 的 应 用 实践 和 电子 资源 数据 质量 控制 方法 提供 参考 。 
[方法 /过 程 ] 采 用 文献 调研 法 提出 电子 资源 数据 质量 控制 的 必要 性 ; 采用 问卷 调查 法 对 同行 图 
书馆 电子 资源 管理 模式 和 困境 进行 调研 ， 提 炼 共性 问题 。 基 于 ALMA 系统 中 对 电子 资源 管理 的 
数据 模型 、 工 作 流程 和 管理 模式 ， 从 电子 资源 库 和 单 册 层级 、 书 目 层 级 、 发 现 系统 和 中 央 发 
现 索 引 层 级 ， 提 出 相应 的 数据 质量 控制 方法 ， 为 电子 资源 管理 过 程 中 数据 质量 控制 提供 实践 
指导 。[ 结 果 / 结 论 ] 电 子 资源 管理 是 一 个 复杂 的 、 跨 越 多 平台 的 系统 工程 ， 图 书馆 应 制定 多 层 
次 、 立 体 化 的 数据 质量 控制 方案 ， 提 升 电子 资源 管理 和 服务 水 平 。 
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1 电子 资源 管理 过 程 中 数据 质量 控制 的 必要 性 
1.1 电子 资源 数据 质量 控制 相关 标准 

资源 检索 与 获取 是 电子 资源 管理 过 程 中 数据 质量 控制 水 平 的 直接 体现 ， 也 是 图 书馆 服务 评价 相关 标准 
中 的 重要 指标 。 多 个 国际 和 国内 标准 ， 如 NISO Z39. 7-2002 (美国 图 书馆 统计 标准 ) ~ ISO 11620: 2008 
(信息 与 文献 国际 图 书馆 绩效 指标 ) 、IS0 16439:2014 (信息 与 文献 图 书馆 影响 力 评估 的 方法 与 流程 ) 、 
GB/T 29182-2012〔 图 书馆 绩效 指标 〉 中 均 包 括 资源 发 现 获取 指标 "。 国 内 相关 研究 也 将 资源 存 取 便利 性 作 
为 评估 图 书馆 管理 服务 能 力 的 一 项 指标 中 。 美 国 国会 图 书馆 发 布 的 《2022-2026 年 数字 馆藏 发 展 战略 》 提 
出 应 提升 资源 的 可 用 性 和 可 访问 性 、 增 强 内 容 的 可 发 现 性 ， 构 建 数 字 馆 藏 集成 仓储 发 现 系 统 中 。 下 一 代 图 
书馆 服务 平台 使 得 图 书馆 电子 资源 全 流程 管理 成 为 可 能 ， 但 也 给 业务 管理 和 数据 质量 提出 了 更 高 的 要 求 。 
系统 迁移 带 来 的 部 门 和 业务 重组 、 电 子 资源 馆 员工 作 职责 的 重新 定义 ， 更 使 得 电子 资源 管理 的 难点 由 订购 
等 业务 流程 管理 转移 到 资源 发 现 和 获取 服务 。 

北美 地 区 对 电子 资源 管理 的 研究 起 步 较 早 ， 如 美国 数字 化 图 书馆 联盟 (digital library 
federation, DLF〉 在 2004 年 发 布 电子 资源 管理 报告 中 。 此 后 ， 欧 美 地 区 学 术 图 书馆 与 出 版 行业 紧密 合作 ， 
建立 起 一 系列 方便 电子 资源 管理 、 揭 示 与 传播 的 技术 规范 ， 并 迅速 在 图 书馆 建立 起 对 应 的 工作 流程 及 工作 
PYG), ALMA 是 在 这 些 工作 流程 及 规范 的 基础 上 开发 的 全 媒体 资源 管理 平台 。 因 此 ， 研 究 与 分 析 ALMA 电 
子 资源 管理 过 程 中 的 数据 质量 控制 ， 对 学 习 同 行 电子 资源 管理 的 先进 经 验 、 提 高 国际 出 版 商 与 图 书馆 之 间 
数据 共享 交换 水 平 、 提 升 图 书馆 资源 发 现 获 取水 平 大 有 帮助 。 

电子 资源 经 费 占 比 高 、 数 量 大 、 类 型 多 样 、 来 源 多 、 分 布 广 的 特点 决定 了 其 是 图 书馆 资源 管理 的 难点 。 
但 是 ， 国 内 图 书馆 基于 下 一 代 服 务 平台 对 电子 资源 管理 的 经 验 普 遍 不 足 ， 资 源 数量 和 服务 体 量 也 存在 不 均 
衡 、 不 匹配 等 情况 。 电 子 资源 数据 的 质量 受 数 据 库 商 数据 服务 、 电 子 资源 馆 员 工作 技能 、 系 统 功 能 支持 等 
多 重 因素 制约 ， 因 此 其 数据 质量 控制 方法 和 规范 成 为 图 书馆 及 出 版 行业 共同 面 对 并 亟待 解决 的 问题 。 图 书 
馆 有 必要 建立 电子 资源 管理 过 程 中 的 数据 质量 控制 方案 ， 以 提升 图 书馆 对 电子 资源 的 管理 和 服务 能 力 。 
1.2 相关 研究 与 实践 现状 
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笔者 采用 文献 调研 法 ， 对 电子 资源 数据 质量 控制 相关 文献 进行 调研 。2022 年 11 H 28-29 日 ， 在 Web 
of Science 核心 合集 用 主题 词 【 TS=(librar*) AND TS=(electronic resource*) AND TS=(data 
quality) 】 检 索 得 到 212 个 结果 ， 去 除 无 关 文献 后 得 到 与 电子 资源 数据 质量 控制 有 关 文 献 23 篇 。 在 中 国 知 
网 用 主题 词 “ 图 书馆 ”、“ 电 子 资源 ”和 “数据 质量 ”进行 检索 ， 得 到 12 个 结果 。 浏 览 这 些 文章 标题 和 摘 
要 ， 分 析 得 出 ， 国 外 图 书馆 引入 下 一 代 服 务 平台 的 时 间 较 早 ， 重 点 关注 馆藏 电子 资源 数据 质量 评估 、 馆 藏 
管理 模式 、 书 目 数 据 质量 、 期 刊 质量 标准 等 方面 ， 并 认为 电子 资源 数据 质量 、 是 否 进行 了 揭示 对 发 现 服务 
有 较 大 影响 *， 有 必要 进行 相应 的 质量 控制 。 国 内 相关 文献 报道 较 少 ， 主 要 集中 在 ALMA RARE 
平台 对 比 研究 中 中、 电子 资源 管理 由、 电子 资源 的 编目 数据 "路 、 使 用 统计 数据 "等 层面 。 电 子 资源 管 
理 过 程 中 数据 质量 控制 方面 ， 仅 见 关 于 电子 党 ARVI ARCH RARE 

笔者 采用 问卷 调查 法 ， 并 通过 邮件 、 微 信 、QQ 等 方式 ， 对 12 个 图 书馆 进行 问卷 调研 。 这 12 个 图 书馆 
包含 了 国内 的 6 个 ALMA 用 户 和 6 个 非 ALMA 用 户 。6 个 非 ALMA 用 户 〈 北 京 大 学 图 书馆 、 北 京 航空 航天 大 学 
图 书馆 、 吉 林 大 学 图 书馆 、 中 南大 学 图 书馆 、 西 安 交通 大 学 图 书馆 、 浙 江 大 学 图 书馆 ) 均 为 国内 “ 双 一 
流 ” 高 校 ， 在 电子 资源 管理 方面 有 丰富 的 经 验 。6 个 ALMA 用 户 (北京 师范 大 学 图 书馆 、 香 港 中 文大 学 深圳 
图 书馆 、 澳 门 科 技 大 学 图 书馆 、 南 方 科 技 大 学 图 书馆 、 中 科 院 高 能 所 图 书馆 、 东 北 师范 大 学 图 书馆 ) 分 布 
在 不 同 地 理 区 域 、 且 系统 上 线 时 间 不 同 ， 具 有 一 定 代 表 性 。 调 查 问卷 内 容 涉及 图 书馆 使 用 的 管理 系统 、 多 
目的 电子 资源 类 型 、 编 目标 准 、 电 子 资源 数量 、 供 应 商 提供 书目 数据 的 比例 、 书 目 数据 获取 途径 、 电 子 资 
源 揭示 馆 员 所 在 部 门 及 分 工 、 电 子 资源 揭示 中 遇 到 的 困难 、 读 者 反馈 与 电子 资源 后 台数 据 揭示 、 资 源 发 现 
相关 的 问题 等 。 由 于 部 分 馆 对 相关 工作 开展 不 多 ， 所 以 收集 的 问卷 项 目 不 是 很 完整 。 对 调研 结果 汇总 分 析 ， 
得 出 如 下 几 点 结论 : 四 这 些 样本 履 盖 的 资源 管理 系统 包括 ALMA、 汇 文 、ALEPH 等 ， 资 源 发 现 系 统 为 
PRIMO、SUMMON、 超 星 发 现 等 。 书 其 中 7 个 图 书馆 对 电子 资源 进行 编目 ， 其 他 图 书馆 (如 采用 汇 文 系统 的 图 
书馆 ) 不 支持 电子 资源 编目 ， 或 图 书馆 无 专职 馆 员 对 电子 资源 进行 编目 。 整 体 上 看 ， 图 书馆 电子 资源 揭示 
人 力 有 限 或 未 设置 相应 岗位 。@ 电 子 资源 的 编目 范围 主要 集中 在 电子 图 书 、 电 子 期 刊 、 学 位 论文 ， 以 买 断 
资源 为 主 ， 尚 未 拓展 到 其 他 资源 类 型 。 由 虽然 电子 资源 有 相关 的 最 新 标准 (GB/T 3792-2021 信息 与 文献 
资源 描述 ) ， 但 国内 图 书馆 尚未 采用 统一 标准 。@@ 电 子 资源 编目 馆 员 通 常 与 纸 本 编目 业务 在 同一 个 编目 工 
作 组 ， 其 中 部 分 原因 是 人 力 有 限 。@@ 遇 到 的 电子 资源 揭示 和 质量 控制 方面 的 困难 包括 : 电子 资源 数据 验收 
[= 机 制 不 完备 、 部 分 数据 库 商 不 提供 书目 数据 、 元 数据 质量 差 、 中 文 资源 揭示 困难 、 读 者 在 发 现 平 台 查 找 不 
= 到 所 需 文 章 或 全 文 访问 获取 故障 等 。 
笔者 以 清华 大 学 图 书馆 作为 案例 进行 研究 ， 主 要 基于 两 点 考虑 : @ 清 华 大 学 图 书馆 较 早 开展 电子 资源 

采购 ， 经 过 多 年 建设 积累 了 较 大 体 量 的 电子 资源 ， 目 前 有 938 个 数据 库 、845 万 册 电 子 图 书 、17. 4 万 种 电 
子 期 刊 和 多 种 其 他 类 型 电子 资源 ， 这 些 资源 分 布 在 全 球 范围 内 200 多 个 异 构 平台 上 。 人 名 清华 大 学 图 书馆 为 

国内 较 早 引进 ALMA 进行 电子 资源 管理 的 图 书馆 ， 积 累 了 丰富 的 电子 资源 管理 经 验 。 迁 移 到 ALMA 之 前 ， 数 
据 库 、 电 子 期 刊 、 电 子 图 书 分 别 由 Metalib、SFX 和 0PAC 进行 管理 ， 基 于 数据 库 导 航 、 期 刊 导 航 、 馆 藏 目 
录 检 索 和 获取 。 迁 移 到 ALMA 和 PRIMO 后 ， 实 现 了 这 些 资源 的 统一 管理 和 发 现 。 而 发 现 平 台 可 检索 的 资源 除 
了 馆 员 在 后 台 管 理 的 期 刊 、 图 书 级 数据 外 ， 还 包括 部 署 在 云端 的 中 央 发 现 索 引 才 盖 的 期 刊 全文 、 as 
研究 数据 集 等 4 亿 多 条 元 数据 以 及 PRIMO 本 地 资源 ， 因 此 数据 管理 层级 增加 ， 数 据 质量 控制 难度 加 大 。 由 
此 可 见 ， 清 华 大 学 图 书馆 的 电子 资源 体 量 大 、 在 国内 引入 ALMA 时 间 较 早 ， 积 累 的 电子 资 
验 较 为 丰富 ， 可 为 同行 对 电子 资源 的 管理 及 数据 质量 控制 提供 参考 。 
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2 ALMA 系统 的 电子 资源 管理 数据 模型 和 工作 流程 
ALMA 系统 实现 了 对 电子 资源 从 订购 到 揭示 的 全 流程 管理 。PRIMO 实现 了 面向 用 户 的 资源 
一 站 式 检索 与 发 现 。 在 ALMA 中 ， 各 类 资源 都 有 统一 的 三 层 结构 数据 模型 (如 图 1 所 示 ) ， 以 


便 实现 资源 的 统一 管理 。 对 于 同一 个 知识 实体 ， 比 如 电子 期 刊 the 1ibrary， 通 常情 况 下 ， 
ALMA 里 只 有 1 条 书目 记录 (metadata management system, MMS) ， 其 单 册 (portfolio) 有 2 个 ， 
对 应 不 同 的 可 访问 年 限 (portfolio coverage) 。 同 时 ， 这 个 知识 实体 所 在 的 两 个 资源 库 
Celectronic collection) 也 有 相应 的 书目 数据 。 
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图 1 ALMA 中 电子 资源 管理 的 数据 模型 


在 ALMA 中 完成 编目 的 资源 会 呈现 在 发 现 平 台 (PRM 系统 界面 ) 、 数 据 库 导 航 和 电子 资 
源 导航 等 多 个 用 户 的 使 用 场景 中 。ALMA 可 作为 链接 解析 器 ， 与 云端 的 资源 元 数据 仓储 实现 从 
引文 到 全 文 的 链接 。 作 为 PRIMO 重要 的 数据 模块 ， 中 央 发 现 索 引 (central discovery index , 
CDI) 基于 ALMA 的 资源 链接 配置 ， 对 馆藏 电子 资源 进行 检索 、 发 现 及 全 文 获取 。ALMA 定时 将 
图 书馆 的 电子 资源 馆藏 文件 (holding file, HF) 发 布 给 CDI。 对 期 刊 来 说 ， 其 ISSN、 可 获 
取 年 限 范围 等 信息 会 被 用 于 匹配 CDI 文章 的 来 源 期 刊 和 年 卷 期 等 信息 ， 并 在 发 现 平台 显示 是 
人 否 有 在 线 全 文 。 因 此 ， 用 户 在 发 现 平台 检索 一 篇 文章 ， 从 触发 检索 到 定位 到 所 在 数据 库 ， 表 
到 顺利 获取 全 文 ， 要 经 过 多 层级 的 数据 匹配 和 映射 。 相 应 术语 概念 说 明 如 表 1 所 示 ， 数 据 从 
ALMA 到 PRIMO 的 发 布 流 程 如 图 2 所 示 : 


表 1 ALMA 系统 中 电子 资源 相关 基本 概念 
术语 说 明 或 示例 
馆藏 (inventory) 某 电子 期 刊 及 其 所 在 资源 库 的 链接 参数 、 可 访问 年 限 等 信息 
电子 资源 库 Celectronic collection) 某 数 据 库 对 应 的 资源 包 ， 如 Oxford University press journals 
单 册 (portfolio) 电子 期 刊 的 可 访问 范围 、 链 接 参 数 等 信息 
服务 Cservice) 电子 资源 库 的 服务 包括 全 文 类 型 及 访问 参数 
书目 (MMS) 电子 期 刊 The Library 的 书目 
中 央 发 现 索 引 Oxford 数据 库 CDI 资源 库 : Oxford Journals 2020 social sciences 
(CDI) 
馆藏 文件 CHF) ALMA 发 布 到 CDI 的 馆藏 文件 ， 包 含 资源 标识 号 、 卷 期 信息 等 
CDI institutional profile 某 电 子 资源 库 的 CDI 配置 文件 
链接 解析 器 (link resolver) ALMA 作为 链接 解析 器 接收 并 解析 OpenURL 信息 ， 构 建 数字 对 象 ， 并 与 
书目 数据 中 的 元 数据 匹配 ， 生 成 服务 链接 
共享 区 知识 库 〈community zone, CZ) ALMA 知识 库 提 供 的 某 数据 库 对 应 的 电子 资源 库 、 单 册 、 书 目 等 信息 
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TE: 表 中 部 分 术语 说 明 或 示例 来 自 图 1。 
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图 2 数据 从 ALMA 到 PRIMO 的 发 布 流程 
JÈ: 参照 2019 年 CCEU 年 会 中 国 Discovery Solution 进展 报告 〈 李 珍 , 康利 芬 ) 中 | 


3 ALMA 系统 对 电子 资源 的 管理 模式 

目前 ， 对 电子 资源 数据 的 揭示 维护 绝 大 部 分 依赖 共享 区 知识 库 ， 知 识 库 没 有 所 需 资 源 或 
资源 覆盖 不 全 、 数 据 质量 较 差 时 ， 馆 员 需 要 对 外 源 数 据 质量 进行 判断 ， 用 数据 批 处 理 软件 核 
查 或 完善 数据 ， 然 后 通过 导入 书目 数据 、 套 录 外 部 数据 源 等 方式 完成 电子 资源 激活 ， 如 图 3 
所 示 。 有 具体 采用 哪 种 数据 管理 方式 ， 主 要 取决 于 拟 揭 示 资 源 的 数据 质量 ， 包 括 元 数据 覆盖 资 
源 范围 是 否 全面 、 字 段 是 否 完备 、 编 目 规则 等 。 根 据 经 验 ， 外 文 出 版 商 的 数据 质量 要 高 于 集 
mers 与 进出 口 公司 和 数据 公司 有 合作 模式 的 数据 库 商 能 提供 更 高 质量 的 元 数据 ， 而 部 分 中 
文 数据 库 商 提供 电子 图 书 书目 数据 的 能 力 和 服务 方面 则 有 所 欠缺 ， 需 要 提升 数据 服务 意识 。 
例如 ， 个 别 出 版 商会 面向 图 书馆 开展 书目 数据 质量 调查 ， 调 查 内 容 涉及 资源 管理 系统 的 选择 、 
书目 数据 的 获取 、 处 理 方 式 和 工具 等 ， 并 关注 元 数据 与 资源 发 现 的 关系 2 。 图 书馆 通过 外 国 
教材 中 心 联合 订购 的 教材 电子 书 、 通 过 易 阅 通 平台 订购 的 电子 书 ， 由 于 进出 口 公 司 有 相应 的 
书目 数据 编目 员 ， 往 往 可 以 提供 较 高 质量 的 书目 数据 ， 并 能 根据 图 书馆 要 求 完 善 书目 数据 。 
而 中 文 电子 书 平台 、 特 别 是 古籍 类 、 音 视频 类 等 资源 类 型 通常 只 能 提供 Excel 形式 的 元 数据 ， 
需要 馆 员 自行 编制 书目 数据 。 图 4 是 馆 员 利用 Excel, Marcedit 等 工具 完成 批量 编目 的 书目 
数据 样 例 。 
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图 3 ALMA 中 对 电子 资源 的 管理 方式 
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图 4 A Excel, Marcedit 等 工具 完成 批量 编目 的 MARC 数据 样 们 


4 各 数据 层级 的 数据 质量 控制 方案 

基于 上 述 ALMA 系统 电子 资源 管理 的 数据 模型 和 工作 流程 ， 以 及 ALMA 电子 资源 管理 方式 的 
介绍 可 发 现 ， 电 子 资源 馆 员 不 仅 需 要 理解 数据 从 ALMA 到 PRIMO 的 发 布 流程 ， 也 应 熟悉 电子 资 
源 管理 的 具体 操作 方法 。 本 部 分 将 结合 电子 资源 管理 数据 模型 和 流程 中 涉及 的 关键 数据 层级 ， 
包括 电子 资源 库 和 单 册 层级 、 书 目 层级 、 发 现 系统 和 中 央 发 现 索 引 层级 ， 分 别提 出 相应 的 数 
据 质量 控制 方法 ， 以 提高 资源 的 发 现 获取 水 平 。 整 体 来 看 ， 电 子 资源 库 、 单 册 和 书目 层级 的 
数据 质量 既 依 赖 于 数据 库 商 提升 数据 服务 和 共享 意识 ， 也 需要 专业 馆 员 提升 对 数据 质量 及 其 
对 用 户 检索 影响 的 认识 ， 并 掌握 电子 资源 流程 管理 和 数据 质 探 方法。 而 发 现 系 统 和 中 央 发 现 
索引 层级 数据 质量 控制 更 多 依赖 于 数据 库 商 对 数据 的 规范 以 及 系统 厂商 对 系统 功能 的 完善 。 


4.1 电子 资源 库 和 单 册 层 级 的 数据 质量 控制 
对 于 电子 资源 库 〈collection) ， 共 享 区 资源 库 会 发 生 资 源 库 删 除 、 合 并 等 更 新 ， 这 些 
变更 会 导致 激活 状态 改变 ， 需 要 馆 员 及 时 追踪 处 理 。 对 于 单 册 (portfolio) 层级 的 数据 质量 
ee 型 、 访 问 参数 、 书 目 数 据 等 信息 ， 并 据 此 制定 相应 的 处 理 
。 就 清华 大 学 图 书馆 而 言 ， 为 了 提升 数据 核查 的 主动 性 和 维护 的 及 时 性 ， 馆 员 在 统计 端 
> ， 定 期 读 取 和 了 解 知识 库 更 新 带 来 的 变化 ， 并 据 此 进行 周期 性 维护 。 
知识 库 数据 更 新 提升 了 资源 数据 准确 性 ， 为 用 户 在 PRIMO 端 检索 数据 提供 便利 ， 但 也 带 来 了 
馆 员 维护 核查 工作 量 增加 等 问题 。 知 识 库 单 册 数 据 的 更 新 包括 资源 可 访问 年 限 信 息 更 新 、 资 
善 等 方面 。 比 如 ， 电 子 图 书 书目 数据 更 新 后 补充 了 505 字段 图 书 章 
节 信 息 ， 更 为 完 善 。 
除了 关注 知识 库 数据 的 变化 ， 在 实践 中 还 采用 了 多 种 方式 ， 如 建议 将 数据 验收 环节 纳入 
采访 员工 作 职责 ;， 如 对 文 持 KBART 数据 收割 的 Springer, Taylor 等 数据 库 配 置 自动 更 新 ;如 


= 


对 电子 书 数据 进行 编目 时 尽量 以 馆 内 纸 本 书 书目 数据 为 基础 数据 ， 提 升 数据 质量 并 便于 发 现 
获取 。 


4.2 书目 层级 的 数据 质量 控制 

电子 资源 经 过 著录 、 标 引 成 为 书目 数据 ， 才 能 为 用 户 提供 更 丰富 的 检索 点 。 资 源 发 现 平 
台 可 实现 对 资源 类 型 、 作 者 、 出 版 等 信息 的 分 面 检索 。 而 检索 结果 的 准确 率 、 碍 全 率 取 决 于 
ALMA 中 的 书目 数据 质量 。 消 党 大 学 图 书馆 较 时 开展 电 了 资源 批量 编目 ， 认 为 国内 图 书馆 整体 
对 数据 质量 的 重视 程度 不 够 ””， 批 量 编目 是 促进 电子 资源 获取 的 有 效 手段 。 随 着 数据 库 商 
数据 服务 意识 的 提高 ， 更 多 数据 库 商 开始 主动 关注 书目 数据 质量 对 次 源 发 现 的 影响 。 

对 于 外 文 图 书 、 外 文 期 刊 等 ， 部 分 书目 数据 可 依赖 共享 区 知识 库 的 数据 ， 部 分 则 依赖 数 
ie 但 共享 区 知识 库 书 目 数据 也 存在 题名 著录 不 准确 、 缺 少 

题 、 作 者 字段 等 情况 ， 质 量 良 著 不 齐 。 有 多 个 ALMA 用 户 建议 知识 库 对 其 提供 的 书目 数据 进 
行 评 秸 ， 告 知 图 书馆 上 日数 据 编目 等 级 ”ISBN/ISSN 题名 、 著者 、 主 题字 段 的 情况 等 ， 方 便 
图 书馆 判断 光 。 对 于 中 文 图 书 、 中 文 期 刊 、 视 频 等 资源 ， 存 在 着 共享 区 知识 库 无 书目 数据 、 
而 数据 库 商 提供 书目 数据 不 规范 、 缺 字段 、 乱 码 或 无 法 提供 书目 数据 等 情况 ， 需 要 馆 员 修订 
或 完全 舍弃 知识 库 书 目 数据 。 中 文 电子 书 数据 源 质量 不 高 通常 也 体现 在 其 自身 平台 数据 不 规 
范 的 情况 ” 。 BA a ny ee ht US A gl 
资源 的 书目 数据 ， 并 认为 元 数据 质量 对 发 现 服务 有 较 大 影响 ”。 而 笔者 在 实践 中 也 发 现 ， 
台 书 目 数据 质量 不 高 时 ， 才 据 库 商 往往 也 难以 提供 让 儒 量 的 书目 数据 ; 才 2 是 清华 大 学 图 忆 
馆 电子 图 书 书目 数据 基本 情况 以 及 采取 的 不 同 数据 处 理 方式 ， 针 对 不 同 数据 库 数 据 源 特别 采 
用 不 同 的 数据 处 理 方式 ， 保 障 了 电子 图 书 数据 的 揭示 更 为 全 面 准确 。 


子 图 书 数据 库 书 目 数 据 基 本 情况 
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Library 地 


对 电子 资源 的 书目 数据 进行 核查 和 批 处 理 是 电子 资源 数据 质量 控制 的 重要 一 环 ， 对 馆 员 
的 胜任 力 有 较 高 要 求 。 茶 大 学 图 书馆 对 编目 和 元 数据 助理 馆 员 的 任职 资格 中 提 到 ， 馆 员 除 需 


具备 编目 工作 经 历 外 ， 还 需 有 具备 ALMA 系统 书目 数据 导入 和 批 处 理 能 力 ， 对 不 同类 型 资源 应 用 
不 同 元 数据 标准 的 能 力 ， 理 解 发 现 平台 元 数据 相关 问题 的 能 力 、 对 关联 数据 的 理解 能 力 等 
281 | 在 对 电子 资源 数据 批 处 理 的 实践 中 ， 馆 员 还 应 掌握 数据 批 处 理 软件 Marcedit、Excel 等 
工具 的 使 用 、ALMA 中 数据 导入 配置 等 的 使 用 。 因 此 ， 馆 员 在 实际 工作 中 应 主动 加 强 掌 握 各 种 
数据 批 处 理 方 法 ， 提 高 书目 数据 批 处 理 效率 和 数据 质量 。 


4.3 发 现 系统 和 中 央 发 现 索引 层级 的 数据 质量 控制 

ALMA 系统 的 书目 记录 会 根据 一 定 规则 (normalization rules) 转录 为 相应 XML 文件 后 入 
库 ， 用 于 读者 查询 和 展示 。 虽 然 发 现 系统 (PRIMO) 并 不 会 对 来 自 ALMA 系统 的 元 数据 本 身 进 
行 修改 ， 但 是 可 以 根据 一 定 的 规则 来 限制 元 数据 中 的 信息 是 否 能 被 检索 或 显示 。 PRIMO 系统 
对 数据 质量 的 控制 主要 来 自 规则 编制 。 这 套 规则 的 编制 方式 非常 灵活 ， 可 根据 使 用 者 的 需求 ， 
对 不 同类 型 资源 的 元 数据 展示 进行 按 需 定制 。 但 由 于 元 数据 转 入 时 ， 图 书馆 可 以 在 展示 、 检 
索 、 排 序 、 去 重 、 分 面 等 方面 进行 订 制 ， 这 些 设置 最 终 会 影响 书目 记录 在 用 户 端 的 展示 和 检 
索 效 果 。 因 此 ， 图 书馆 需 不 断 调 整 使 规则 编制 实现 最 优化 。 

实践 中 ， 馆 员 可 以 根据 需要 设 定 条 件 ， 来 决定 发 现 系统 中 不 同类 型 资源 的 呈现 内 容 ; 也 
可 以 根据 去 重 算法 ， 编 辑 ALMA 系统 中 的 记录 ，PRIMO 系统 会 依据 识别 符 等 信息 将 这 些 数据 进 
行 匹 配合 并 操作 ， 形 成 一 条 更 完整 的 逻辑 记录 ， 使 同 种 资源 的 不 同类 型 集中 在 一 条 书目 记录 
中 呈现 ， 方 便 用 户 获取 资源 。 但 在 进行 这 些 有 意识 的 通过 系统 规则 影响 记录 呈现 的 时 候 ， 其 


实 更 应 该 考虑 用 户 是 否 需要 这 种 合并 或 者 去 重 的 便利 。 在 实际 使 用 中 ， 有 些 图 书馆 对 系统 进 
行 限制 ， 不 再 合并 同 种 资源 不 同类 型 的 记录 ， 而 是 选择 将 所 有 记录 原样 呈现 ， 供 用 户 自己 进 
行 挑选 。 同 时 ， 我 们 也 应 该 看 到 ， 用 户 的 检索 习惯 受 网 络 搜索 引擎 的 影响 ， 输 入 的 检索 条 件 
越 来 越 宽 沁 ， 一 定 程度 上 需要 系统 去 根据 一 些 用 户 行为 习惯 来 猜测 用 户 实际 想 要 的 结果 。 而 
发 现 系统 现在 要 兼顾 查 全 率 和 查 准 率 ， 仅 从 记录 的 查 重 及 合并 上 来 做 ， 已 经 达 不 到 要 求 ， 而 
是 需要 从 发 现 系 统 本 身 的 搜索 引擎 上 来 改进 ， 要 做 到 这 一 点 需要 广 商 更 多 的 技术 支持 ， 图 书 
馆 本 身 已 经 很 难 实现 。 

中 央 发 现 索 引 〈CDI) 的 元 数据 来 自 1 600 余 个 出 版 商 、 内 容 提供 商 、 机 构 库 中 超过 40 亿 
条 的 元 数据 ， 包 括 期 刊 文章 、 图 书 篇 章 记 录 、 数 据 集合 等 。 针 对 CDI 层级 的 数据 质量 控制 ， 
国外 同行 曾 从 内 容 、 检 索 功能 、 发 现 、 交 互 性 和 易 用 性 5 个 方面 的 36 个 指标 对 用 户 对 资源 发 
现 平 台 的 使 用 进行 调查 分 析 ， 用 户 认 为 易 用 性 最 重要 ， 中 央 索 引 数据 质量 权重 最 高 ”。 笔 者 
及 同行 都 发 表 了 关于 下 一 代 服 务 平台 环境 下 电子 资源 访问 问题 与 影响 因素 相关 的 文章 ， 认 为 
ALMA 知识 库 数据 质量 、 元 数据 质量 、 电 子 资源 自身 信息 变更 等 是 电子 资源 访问 故障 的 主要 原 
因 "*”。 对 于 某 个 电子 资源 库 来 说 ， 其 文章 级 检索 与 获取 除了 与 单 册 数 据 、 书 目 数据 、 资 源 
从 ALMA 到 PRIMO 的 发 布 有 关外 ， 与 资源 库 的 CDI 数据 配置 也 有 直接 关系 。 电 子 资源 馆 员 一 方 
面 需 要 对 电子 资源 库 的 CDI 表单 进行 配置 和 维护 ， 男 一 方面 应 了 解 相应 数据 库 的 篇 章 级 资源 
元 数据 的 履 盖 范围 。 也 可 根据 该 资源 库 的 CDI 数据 质量 ， 决 定 是 否 支 持 篇 章 级 资源 在 发 现 端 
的 显示 。 这 些 都 需要 馆 员 对 各 数据 库 的 数据 情况 及 系统 配置 进行 深入 的 测试 分 析 ， 据 此 制定 
配置 方案 。 


5. 数据 质量 控制 的 建议 和 举措 

除 上 述 质 量 控制 外 ， 图 书馆 还 可 在 加 强 文 献 资产 和 文档 制度 规范 管理 、 充 分 利用 系统 功 
能 实现 数据 自动 收割 和 对 接 、 基 于 统计 分 析 进 行 质量 控制 、 建 立 与 师 生 间 有 效 的 沟通 机 制 和 
渠道 、 加 强 馆 员 能 力 培养 和 团队 协作 、 加 强 数 据 共 建 共享 六 个 方面 开展 工作 。 


5.1 加 强 文献 资产 和 文档 制度 规范 管理 
文献 资产 管理 是 图 书馆 服务 的 基础 。 图 书馆 应 构建 精准 化 的 文献 元 数据 资产 管理 体系 ， 


改变 其 “有 资源 无 数据 ”的 赛 境 ， 使 图 书馆 成 为 真正 意义 上 资源 的 所 有 者 ”“ 。 笔 者 认为 ， 应 
对 数据 库 商 提供 的 资源 列表 提出 明确 要 求 ， 并 建议 将 数据 全 面 性 、 准 确 性 要 求 加 入 资源 订购 
合同 。 此 外 ， 图 书馆 应 对 来 自 数据 商 的 订购 资源 数据 列表 、 书 目 数据 进行 有 效 存 档 。 电 子 资 
源 管理 头绪 多 ， 需 要 有 相关 的 文档 制度 进行 规范 管理 。 比 如 ， 建 立 适 合 本 馆 的 电子 期 刊 揭示 
流程 和 规范 ， 基 于 各 个 数据 库 建 立 馆藏 数据 维护 手册 、 做 好 元 数据 规范 存档 ， 这 些 工作 应 
该 贯穿 于 电子 资源 管理 的 整个 过 程 。 


5. 2 充分 利用 系统 功能 实现 数据 自动 收割 和 对 接 

对 于 系统 支持 自动 收割 的 数据 库 ， 如 Springer. Elsevier, Wiley 等 ， 图 书馆 可 与 数据 
库 商 沟通 获取 数据 收割 参数 进行 配置 ， 实 现 资 源 按 周期 自动 收割 。 对 于 可 从 平台 下 载 订购 数 
据 的 库 ， 如 Springer， 馆 员 可 自行 从 平台 下 载 并 导入 ALMA 系统 支持 的 KBART 格式 。 这 两 种 方 
式 都 可 以 提高 数据 准确 性 ， 同 时 减轻 馆 员 维护 量 。 资 源 使 用 数据 ， 如 COUNTER 报告 ， 也 建议 
配置 自动 收割 协议 ， 实 现 数据 自动 对 接 。 


5. 3 基于 统计 分 析 进 行 质量 控制 

有 国外 同行 认为 ，ALMA 系统 统计 分 析 功 能 可 帮助 图 书馆 发 现 资 源 访问 获取 故障 、 了 解 业 
务 趋势 和 用 户 使 用 行为 H。 虽 然 研 究 这 些 模块 的 数据 对 馆 员 来 说 是 非常 耗 时 的 ， 但 是 图 书馆 
有 必要 对 馆 员 进行 培训 并 使 得 更 多 馆 员 掌握 建立 数据 报告 的 技能 并 成 立 团 队 进 行 分 析 数 据 管 
E. ALMA 统计 端 提供 了 多 个 访问 服务 统计 功能 。 比 如 ， 根 据 题名 检索 排序 的 报告 ， 可 以 判断 
馆藏 发 展 应 该 关注 哪些 方面 。 通 过 使 用 链接 解析 器 获取 资源 失效 的 报告 ， 可 以 关注 如 何 降低 
无 服务 的 数据 。 在 实践 中 ， 清 华 大 学 图 书馆 会 用 报告 “Top ten article title accesses 
via OpenURL requests without services in the previous year” 追 踪 访 问 故 障 原因 并 进 
行 解决 。 对 数据 层面 的 深入 分 析 可 以 以 点 带 面 地 发 现 数据 库 层级 的 问题 。 这 个 模块 的 运用 ， 
不 仅 可 以 帮助 馆 员 了 解读 者 对 资源 的 使 用 需求 、 遇 到 的 困难 ， 也 提高 了 馆 员 的 数据 管理 能 力 
和 服务 意识 。 


5.4 建立 与 师 生 间 有 效 、 多 渠道 的 反馈 与 沟通 机 制 

馆 员 可 以 通过 座谈 交流 、 问 卷 调查 、 资 源 使 用 数据 分 析 、 用 户 使 用 行为 分 析 等 多 种 方式 
了 解 师 生 对 电子 资源 的 使 用 习惯 和 使 用 体验 ， 使 得 图 书馆 对 资源 的 管理 与 服务 需求 更 好 地 融 
合 。 清 华 大 学 图 书馆 通过 多 个 渠道 接收 师 生 关于 电子 资源 获取 的 反馈 。 包 括 资源 发 现 平 台 
“问题 反馈 ”表单 、 馆 内 电子 资源 微 信 交 流 群 、 学 科 馆 员 或 馆 际 互 借 反馈 的 来 自 师 生 的 需求 
和 咨询 等 。 馆 内 PRIMO 系统 界面 水 木 搜索 的 “问题 反馈 ”栏目 ， 能 够 接收 到 师 生 关于 资源 荐 
购 、 访 问 与 获取 等 方面 的 建议 ， 其 中 与 电子 资源 访问 与 获取 方面 的 建议 集中 在 平台 数据 、 元 
数据 错误 、 全 文 获取 失效 、 校 外 访问 、 使 用 权限 等 方方面面 ， 成 为 图 书馆 与 用 户 沟 通 的 桥梁 。 


5.5 加 强 馆 员 能 力 培养 和 团队 协作 

电子 资源 管理 模式 和 系统 的 转变 带 来 业务 和 机 构 重组 ， 催 生 了 图 书馆 新 架构 5 。 电 子 资源 馆 员 核心 能 
力 培养 也 受到 业界 关注 。2017 年 ， 美 国 图 书馆 协会 american library association, ALA) 下 属 的 图 书馆 
馆藏 与 技术 服务 协会 理事 会 发 布 《编目 和 元 数据 专业 馆 员 核心 能 力 》 标 准 吕 。 北 美 连续 出 版 物 兴 趣 
(north american serials interest group, NASIG) 执行 委员 会 于 2013 年 批准 采用 的 一 项 电子 资源 馆 员 
职业 能 力 标准 包括 七 项 核心 能 力 喇 。 有 研究 认为 ， 目 前 国内 电子 资源 馆 员 的 核心 能 力 水 平整 体 偏 低 5 喇 。 图 
情 领 域 应 在 教学 课程 设置 和 在 线 培训 两 个 方面 更 加 关注 图 书馆 员 自 身 的 职业 发 展 。 一 方面 ， 在 图 情 领 域 课 
程 设置 上 ， 应 更 加 注重 与 实际 工作 的 联系 。 另 一 方面 ， 图 书馆 应 借助 美国 图 书馆 协会 在 线 平台 “、 图 书馆 
员 职 业 发 展 教育 平台 Library Juice Academy” 等 为 馆 员 提 供 能 力 提升 机 会 。 图 书馆 应 思考 有 效 的 岗位 配 
置 和 任务 分 配方 式 ， 加 强 电 子 资源 管理 知识 体系 培训 ， 支 持 馆 员 技 能 提升 。 另 外 ， 电 子 资源 管理 需要 更 多 


的 团队 协作 ， 应 建立 相应 的 协作 机 制 和 流程 ， 发 挥 采访 馆 员 、 揭 示 馆 员 、 参 考 咨 询 馆 员 、 技 术 馆 员 各 自 的 
优势 ， 有 效 协 调 协作 ， 提 升 应 对 和 解决 相关 问题 的 能 力 ， 使 得 馆 员 在 电子 资源 整体 化 管理 模式 中 找到 自己 
的 位 置 。 


5.6 加 强 与 系统 开发 商 和 资源 共享 联盟 的 建设 与 合作 

下 一 代 服 务 平 台 环 境 驱 动 图 书馆 融入 电子 资源 管理 的 整个 生态 圈 ， 图 书馆 独立 管理 电子 资源 的 难度 加 
大 ， 业 界 开 始 寻 求 以 联盟 的 方式 统一 管理 电子 资源 。 一 项 关于 图 书馆 联盟 采用 ALMA 系统 情况 的 调研 显示 ， 
图 书馆 间 以 联盟 形式 选用 ALMA 系统 进行 统一 资源 管理 和 服务 的 联盟 数量 呈 上 涨 趋势 思 。 例 如 ， 日 本 国立 
情报 学 研究 所 引进 ALMA 系统 为 日 本 大 学 图 书馆 电子 资源 采购 联盟 500 余 家 图 书馆 提供 电子 资源 管理 支持 
中 。 因 此 ， 图 书馆 一 方面 应 进一步 加 强 与 系统 开发 商 的 沟通 和 深度 合作 ， 结 合 本 地 化 需求 进行 开发 升级 ， 
提升 系统 性 能 和 国内 服务 能 力 ; 男 一 方面 ， 应 借助 联盟 支撑 作用 加 强人 合作， 借助 
DRAA、CALIS、CASHL、NSTL 等 机 构 力 量 以 及 馆 际 合作 共享 数据 等 方式 ， 寻 求 与 下 一 代 图 书馆 服务 平台 的 融 
合 发 展 和 数据 共享 。 图 书馆 不 仅 要 与 系统 平台 商 、 联 盟 之 间 加 强 沟通 合作 ， 也 应 与 出 版 行业 联手 探讨 更 科 
学 、 更 高 效 的 电子 资源 揭示 方式 ， 形 成 数据 质量 控制 提升 的 合力 。 


6 结论 

下 一 代 图 书馆 服务 平台 的 应 用 、 电 子 资源 的 特点 和 用 户 需 求 的 多 样 化 , 对 图 书馆 乃至 整个 
电子 资源 生态 圈 都 提出 了 挑战 ， 对 图 书馆 及 电子 资源 的 管理 和 服务 能 力 提 出 了 更 高 要 求 。 图 
书馆 应 因 势 而 变 ， 积 极 应 对 变化 ， 制 定 多 层次 、 立 体 化 的 电子 资源 数据 质量 控制 方案 ， 提 升 
自身 电子 资源 管理 和 服务 水 平 。 本 文 调研 了 12 个 同行 图 书馆 在 电子 资源 数据 揭示 和 质量 控制 
方面 遇 到 的 共性 问题 。 并 介绍 了 清华 大 学 图 书馆 基于 ALMA 系统 的 多 层级 数据 质量 控制 方案 ， 
还 从 制度 建设 、 技 术 支 撑 、 培 训 、 合 作 等 角度 提出 了 多 项 提升 电子 资源 数据 质量 的 建议 ， 期 
待 这 些 实践 经 验 可 以 为 同行 图 书馆 提供 借鉴 参考 ， 并 引起 整个 出 版 商 、 系 统 商 等 电子 资源 生 
态 圈 中 各 个 主体 对 电子 资源 数据 质量 控制 的 关注 。 
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Research on Data Quality Control in Electronic Resource Management: Taking the 
Practice of Tsinghua University Library Based on ALMA System as an Example 


Wu Lina Dou Tianfang Zhouhong Liuyang 
Tsinghua University Library, Beijing, 100084 
Abstract: [Purpose/Significance] This paper puts forward the experience of 

Tsinghua University Library in electronic resource management and quality control 
based on ALMA system, which can provide reference for the application practice of 
peer libraries in the next generation library service platform and the method of 
electronic resource data quality control. [Method/Process] The necessity of data 
quality control of electronic resources was proposed through literature research; 
This paper adopted the method of questionnaire to investigate the electronic 
resource management mode and predicament of peer libraries, and extracted common 
problems. Based on the data model, workflow and management mode of electronic 
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resource management in ALMA system, this paper put forward corresponding data 
quality control methods from the electronic resource library and single volume 
level, bibliographic level, discovery system and central discovery index level, 
providing reference for data quality control in the process of electronic 
resource management. [Result/Conclusion] Electronic resource management is a 
complex and multi-platform system project. The library should develop multi-level 
and three-dimensional data quality control scheme, and improve the electronic 
resource management and service level 
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